Más allá de las instantáneas estáticas: Un marco de evaluación fundamentado para modelos de lenguaje en la frontera agentiva.
Evaluación fundamentada de modelos agentivos que va más allá de instantáneas estáticas. Descubre un enfoque dinámico y profundo para medir el rendimiento real de agentes inteligentes.